Rの基礎

労働経済学2

川田恵介

おすすめワークフロー

コード開発

  • コンピュータが”理解できる言語”で、命令計画者を作成

  • 例: LaborForceYear.csvを読み込み、Dataという名前で保存せよ

library(tidyverse,
        gtsummary) # tidyverseのロード

Data <- read_csv("LaborForceYear.csv") # csvファイルの読み込み

Rの基本文法

  • 入力Object関数によって変換し、 出力Object

一般例

OutputObject <- verb(InputObject)

Project folder

  • Passが接続されるfolder

  • csvやexcel形式で保存されている”データ”をRのObjectに変換

    • Project folderを使わないとパス指定が必要になり煩雑
  • 分析に用いるデータ、コード、成果物(図やデータ)が自動的に保存される

Packages

  • “User”により作成された関数

    • とりあえずrmarkdownとtidyverseをインストール

付録: おすすめ設定

  • Tools -> Grobal options -> Rmarkdown -> Basic から、 “Show output inline…” のチェックを外す

  • Visual モードをSource モードに切り替える

    • 現状では、多くの結果を表示すると挙動が遅くなることがあるため

ggplot2

  • tidyverseに収録される可視化用関数群

  • キャンバスの作成 + 描写の文法で、柔軟に図を可視化できる

ggplot(Data,aes(x = Year,
                y = Employment)) + # キャンバスの作成
  geom_line() + # タイムラインの描写
  facet_wrap(~Month) # 月毎に分割

基本

  • ggplotに用いるデータとaes内にx軸、y軸に用いる変数を指定

  • geom_@@ で描写する図の種類を指定

    • goem_line: タイムライン

    • goem_dotplot: 散布図

    • geom_bar: 棒グラフ

典型的間違い

library(tidyverse,
        gtsummary) 

Data <- Read_csv("LaborForceYear.csv") # タイポ

ggplot(Raw,aes(x = Year, # 存在しないObjectを参照
                y = Employment)) <- # 関係子間違い
  geom_line() +
  facet_wrap(~Month)